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摘 要 : 现 有 移动 群 智 感知 任务 推荐 的 共同 缺点 是 : 一 方面 ， 未 充分 考虑 时 空 信息 对 工人 偏好 的 影响 ， 导 致 推荐 准 
确 性 低 ; 另 一 方面 ， 和 忽略 任务 流行 度 对 推荐 的 影响 ， 导 致 推荐 履 盖 率 差 。 为 解决 这 些 问 题 ， 本 文 提 出 一 种 基于 时 空 
信息 和 任务 流行 度 分 析 的 移动 群 等 感 知 任务 推荐 方法 。 首 先 ， 充 分 利用 工人 执行 于 记录 中 的 相关 信息 (如 工人 执行 任务 
的 时 间 、 位 置 )， 准 确 预测 工人 对 任务 的 偏好 。 其 次 ， 基 于 工人 声 党 和 任务 执行 情况 分 析 任务 流行 度 并 设计 任务 流行 
度 惩 罚 因 子 ， 提 升 推 荐 效果 的 履 盖 率 。 然 后 ， 结 合 工 人 偏好 和 流行 度 惩 罚 因 子 生 成 任务 推荐 列表 。 实 验 结 果 表明 ， 
与 现 有 基线 方法 相 比 ， 所 提出 方法 在 推荐 准确 率 上 平均 提升 了 3.$%， 推 荐 履 盖 率 上 平均 提高 了 25%. 
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Abstract: The drawbacks of existing task recommendation in mobile crowd sensing were as follows: on the one hand, not 
fully considering the influence of spatial-temporal information on worker preference led to low accuracy of recommendation; 
On the other hand, ignoring the impact of task popularity on recommendation led to poor recommendation coverage. To solve 
these drawbacks, this paper proposed a novel task recommendation approach based on spatial-temporal information and task 
popularity analysis in mobile crowd sensing. Firstly, this approach made full use of the relevant information contained in the 
worker execution record (e. g. , the time and location of worker performing tasks) to accurately predict the preference of 
worker for performing tasks. Secondly, in order to reduce the impact of popular tasks on recommendation coverage, this paper 
analyzed task popularity based on worker reputation and task execution record, and designed appropriate task popularity 
penalty factor. Then, combining worker preference and task popularity penalty factor, this paper provided an appropriate task 
recommendation list for each worker. Finally, the experimental results show that compared with the existing baseline methods, 
the proposed method improves the recommendation accuracy by 3.5% and the recommendation coverage by 259^. 
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0 alg 实现 任务 推荐 。 例 如 ， 基 于 工人 相似 性 或 者 任务 相似 性 [5-1 
一 的 任务 推荐 方法 、 基 于 届 辑 回归 模型 的 方法 0 I2。 这 些 方法 
移动 群 智 感知 (Mobile crowd sensing, MCS)UI 是 一 种 具有 ”都 需要 提前 制定 影响 工人 偏好 的 因素 ， 但 是 在 移动 群 智 感知 
广阔 前 景 的 感知 模式 ， 已 广泛 应 用 于 很 多 领域 ， 例 如 环境 监 。” 中 ， 影 响 工 人 偏好 的 因素 众多 ， 很 难 提前 制定 所 有 因素 。 为 
测 趾 、 健 康 数 据 收集 加、 工业 控制 管理 自 、 地 质 勘 测 旬 和 交通 。 ”解决 这 个 问题 ,一 些 研究 开始 将 推荐 系统 3 应 用 到 移动 群 知 
规划 (9 等 。 虎 型 的 移动 群 智 感知 系统 由 任务 发 布 方 、 任务 完 感知 领域 的 任务 推荐 ， 从 工人 的 历史 执行 记录 中 预测 工人 偏 
成 方 (工人 ) 和 MCS 平台 三 部 分 组 成 。 其 工作 流程 如 下 : 任务 好 。 例 如 ， 文 献 [14, 15] 利 用 矩阵 分 解 模型 预测 工人 偏好 ， 并 
发 布 方 将 任务 请 求 发 布 在 MCS FE, MCS 平台 根据 接收 到 ”依据 偏好 为 工人 生成 任务 推荐 列表 。 文 献 [16] 提 出 一 种 基于 
的 任务 请 求 为 工人 建立 任务 列表 ， 工 人 从 列表 中 选择 任务 去 特征 的 贝 叶 斯 任务 推荐 方法 ， 通 过 任务 类 别 来 学 习 任 务 的 潜 
执行 ， 并 将 感知 数据 上 传 至 MCS 平台 ，MCS 平台 最 终 将 感知 。 在 特征 , 解决 新 任务 冷 启动 情况 下 的 任务 推荐 问题 ,文献 [17] 
数据 反馈 给 任务 发 布 方 。 在 这 个 过 程 中 ， 工 人 选择 任务 的 可 能 。 综合 考虑 每 个 工人 的 偏好 和 可 靠 性 实现 任务 推荐 。 


c 


性 受 工人 偏好 的 影响 。 因 此 ， 如 何 挖掘 工人 偏好 ， 向 工人 推荐 上 述 方 法 未 充分 考虑 工人 偏好 的 时 空 变化 ， 这 会 影响 推 
最 有 可 能 执行 的 任务 列表 尤为 重要 。 任 务 推荐 的 效率 和 质量 不 ” 荐 准确 度 。 一 方面 ， 工 人 的 偏好 随 着 时 间 动 态 变化 ， 工 人 近 
仅 会 影响 工人 的 执行 意愿 ， 也 会 影响 任务 的 感知 质量 。 期 的 任务 选择 更 能 代表 工人 目前 的 偏好 ， 男 一 方面 ， 移 动 群 


现 有 研究 倾向 于 使 用 单一 模型 来 学 习 工 人 偏好 中 ， 进 而 。 智 感 知 中 的 任务 分 布 在 不 同 的 感知 区 域 ， 工 人 需要 移动 到 感 
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知 区 域 地 点 去 执行 任务 ， 出 于 自身 成 本 角度 考虑 ， 工 人 更 倾 
向 于 执行 距离 自己 较 近 位 置 的 任务 。 尽 管 文献 [18] 利 用 张 量 
分 解 模型 实现 基于 工人 位 置 的 任务 推荐 ， 但 是 受到 工人 流动 
性 的 影响 中 I， 该 模型 需要 频繁 更 新 来 适应 工人 的 位 置 变 化 ， 
导致 不 能 及 时 捕捉 工人 新 的 偏好 。 因 此 ， 如 何 结合 工人 时 空 
言 息 来 准确 预测 工人 偏好 是 一 大 挑战 。 

男 外 ， 现 有 移动 群 知 感知 任务 推荐 研究 忽略 了 任务 流行 
度 对 推荐 效果 的 影响 ， 这 会 产生 流行 度 偏差 问题 1， 造 成 任 
务 推 荐 覆盖 率 下 降 。 例 如 ， 市 区 的 交通 流量 监测 等 流行 任务 
可 能 会 因为 其 执行 简单 而 受到 大 量 工人 喜欢 ， 如 果 平 台 为 这 
些 工 人 都 推荐 该 任务 ， 会 产生 感知 数据 元 余 ， 而 诸如 山区 地 
质 水 平 测量 等 冷门 任务 则 可 能 因为 没 得 到 足够 的 推广 而 收集 
不 到 充足 的 样本 导致 任务 失败 。 一 般 情 况 下 ， 推 荐 系统 领域 
中 任务 的 流行 程度 由 执行 该 任务 的 工人 比例 决定 ,比例 越 高 ， 
则 任务 流行 度 越 高 中。 在 移动 群 智 感知 系统 中 ， 工 人 具有 从 
众 心理 ， 容 易 受 到 其 他 工人 的 影响 而 去 执行 茶 个 任务 ， 导 致 
任务 的 流行 度 发 生变 化 。 因 此 ， 任 务 流行 度 和 工人 声誉 关系 
密切 ， 声 誉 越 高 的 工人 对 其 他 工人 的 影响 更 大 ， 进 而 对 任务 
流行 度 的 影响 也 就 更 大 。 因 此 ， 基 于 工人 声誉 和 任务 执行 情 
况 分 析 任 务 的 流行 度 ， 设 计 合 理 的 流行 度 惩罚 因子 ， 提 高 任 
PEPEE, ÆA- AHR. 

针对 上 述 挑 战 ， 本 文 提出 基于 时 空 信息 和 流行 度 分 析 的 移 
动 群 智 感 知 任务 推荐 方法 (Time Matrix Factorization and 
Bidirectional Long Short-Term Memory, TimeMF-BiLSTM), iZ7; 
法 综合 考虑 工人 偏好 和 任务 流行 度 惩罚 因子 为 工人 推荐 任务 列 
表 ， 保 证 任务 推荐 的 准确 度 和 履 盖 率 。 本 文 的 主要 贡献 如 下 : 
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并 设计 合理 的 任务 流行 度 惩罚 因子 ,保证 任务 推荐 的 履 盖 率 。 
1 系统 模型 


1 展示 了 TimeMF-BiLSTM 任务 推荐 方法 的 整体 架构 。 
该 方法 先 使 用 融合 时 间 因 素 的 矩阵 分 解 模 型 (Time Matrix 
Factorization, TimeMF) 从 工人 执行 记录 中 学 习 工 人 和 任务 的 
隐 含 关系 ( 即 工人 潜在 特征 向 量 和 任务 潜在 特征 )， 得 出 工人 
对 任务 的 偏好 ( 记 为 TimeMF 偏好 评分 )， 解 决 工 人 偏好 随时 
间 动 态 改 变 的 问题 ;再 使 用 双向 长 短期 记忆 网 络 
(Bidirectional Long Short-Term Memory, BiLSTM) 从 工人 GPS 
轨迹 序列 中 学 习 其 下 一 时 刻 可 能 到 达 的 位 置 ， 并 基于 任务 与 
该 位 置 之 间 的 距离 得 到 工人 偏好 ( 记 为 BiLSTM 偏好 评分 )， 
解决 工人 偏好 随 着 工人 位 置 动态 改变 的 问题 ; 然后 ， 将 
TimeMF 模型 学 习 到 的 工人 偏好 和 BiLSTM 模型 学 习 到 的 工人 
偏好 使 用 逻辑 回归 方法 融合 在 一 起 , 综合 得 到 工人 的 偏好 评分 ， 
保证 任务 推荐 的 准确 性 ， 此 外 ， 引 入 社交 网 络 计算 工人 声誉 ， 
并 根据 任务 执行 情况 分 析 工 人 之 间 的 影响 因子 ， 结 合 工人 声誉 
和 工人 影响 因子 计算 任务 流行 度 ， 构 造 与 任务 流行 度 负 相关 的 
惩 如 因子 ， 使 用 流行 度 惩罚 因子 和 工人 偏好 相 乘 得 到 工人 对 任 
务 的 最 终 评 分 ， 解 决 由 于 任务 流行 度 偏差 造成 的 感知 数据 歼 盖 
不 平衡 问题 。 在 此 基础 上 ， 将 工人 对 任务 的 最 终 评分 从 高 到 低 
进行 排序 ， 为 每 一 个 工人 生成 TopN 任务 推荐 列表 。 

本 文 使 用 的 主要 参数 描述 如 下 : m 个 工人 的 集合 表示 为 
U={w,w,.…sUw} ，n 个 任务 的 集合 表示 为 Y= 人 y,w…,w} EA 
工人 的 执行 记录 表示 为 亚 , 包含 工人 ui 执行 的 所 有 任务 ， 
每 个 任务 的 执行 情况 表示 为 %，™ 包括 执行 任务 v; 的 所 有 


a) 使 用 融合 时 间 因 素 的 矩阵 分 解 模 型 从 工人 历史 执行 
数据 中 学 习 工 人 和 任务 的 隐 仿 关系， 再 利用 双 回 长 短期 记忆 
网 络 模 型 从 工人 的 轨迹 信息 中 提取 工人 的 位 置 偏 好 信息 ， 将 
两 个 模型 得 到 的 偏好 融合 得 到 精确 度 更 高 的 任务 推荐 。 

b) 引入 社交 网 络 计算 工人 声誉 , 提出 一 种 基于 工人 声誉 
信息 的 任务 流行 度 计算 方 法 , 实现 对 任务 流行 度 更 精确 分 析 ， 


RE 


工人 执 1 计算 _| 初始 工人 任 | TimeMF 模 
行 记录 务 评分 和 矩阵 | 型 学 习 


TN 


工人 ID 编号 ， Le (545). (5.5)...(5.5).) 表示 工人 u B] GPS 
轨迹 序列 ,大 是 由 经 度 和 纬度 组 成 的 二 元 组 ， 代 表 工 人 ui 在 
时 刻 时 的 位 置 。 本 文 提出 一 种 有 效 的 方法 来 精确 计算 工人 
和 任务 之 间 的 评分 矩阵 了 Y， 为 每 个 工人 生成 TopN 任务 推荐 
列表 ， 目 标 是 最 大 化 任务 推荐 的 准确 率 和 和 者 盖 率 ， 任 务 推荐 
列表 的 长 度 N 由 平台 根据 实际 情况 设置 。 
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Fig. 1 
2 TARF 


2.1 融入 时 间 因 素 的 矩阵 分 解 

为 解决 工人 偏好 随时 间 动 态 改 变 的 问题 ， 使 用 TimeMF 
模型 学 习 工 人 偏好 。TimeMF 模型 通过 不 断 迭 代 学 习 工 人 淤 
在 特征 向 量 避 和 任务 潜在 特征 向 量 并 利用 两 者 乘积 预测 
工人 任务 评分 矩阵 MP ， 即 将 原始 工人 任务 评分 矩阵 MP 中 
的 零 值 补 全 。TimeMEF 模型 主要 包含 三 个 部 分 : 四 初始 工人 任 
务 评 分 矩阵 构建 。 根 据 工人 执行 记录 构建 原始 工人 任务 评分 矩 
阵 ， 并 考虑 时 间 因 素 对 工人 偏好 的 影响 ，b)TimeMF 模型 学 习 。 
根据 原始 工人 任务 评分 矩阵 ， 采 用 合适 的 算法 对 任务 潜在 特征 
进行 迭代 更 新 ， 并 最 终 达 到 一 个 最 优 解 ， 使 得 工人 潜在 特征 向 
量 和 任务 潜在 特征 向 量 的 乘积 逼近 原始 工人 任务 评分 矩阵 ;，c) 


图 1 基于 时 空 信 息 和 流行 度 分 析 的 移动 群 智 感知 任务 推荐 
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偏好 评分 生成 。 根 据 上 一 阶段 最 终 得 到 的 工人 潜在 特征 向 量 和 
任务 潜在 特征 癌 量 ， 实 现 工人 对 任务 的 评分 预测 。 
2.1.1 40145 LAAIE TE AE TERT EE 

工人 对 任务 的 评分 表示 工人 对 该 任务 的 偏好 , 由 于 MCS 
平台 中 很 少 要 求 工人 对 任务 有 显 式 的 评分 ， 因 此 本 文 使 用 工 
人 执行 任务 的 次 数 来 代替 工人 对 任务 的 评分 ， 工 人 ui 执行 任 
务 vi 以 用 三 元 组 levet) 来 表示 , tyje LA ui 执行 任务 vw 的 时 
刻 。 若 工人 uA ty AAT TES v MERTA wi 对 任务 vj Is 
兴趣 ， 世 可 =1， 反 之 ， 则 表明 该 时 刻 工 人 到 对 任务 vi 不 感 
(ui v;.t;) 20, 

考虑 到 工人 偏好 的 时 间 动 态 特 性 ， 工 人 最 近 一 段 时 间 执 
行 的 任务 更 能 代表 工人 的 偏好 ， 因 此 ， 引 入 牛顿 冷却 定律 的 
思想 ， 通 过 指数 衰减 函数 em%) 使 评分 信息 的 权重 随时 间 呈 


指数 衰减 。 其 中 , 上 是 当前 时 刻 , t; DON ui 执行 任务 vj 的 时 
刻 ，4 是 时 间 衰 减 因 子 ，4 > 0， 且 4 越 大 ， 历 史 偏 好 的 重要 
程度 越 低 。 在 此 基础 上 ， 建 立 工人 任务 原始 评分 矩阵 MP. 
MP 中 的 每 一 个 子 元 素 mpg 通过 下 式 计 算 : 
mp, = 2, a, 9 (us v;) (1) 
2.1.2 TimeMF 模型 学 习 
工人 潜在 特征 向 量 和 任务 潜在 特征 向 量 用 两 个 磊 维 的 低 
秩 特 征 和 矩阵 U Vs, Uem"*W]pRR—ÍT4WA— 7 LA ui 
的 潜在 特征 向 量 Vi, V eRo* 的 每 一 行 代表 一 个 任务 vj 的 潜在 
特征 向 量 Vj, U 入 中 的 值 随机 初始 化 。TimeMEF 模型 的 训 


练 目标 是 保证 MP 和 原始 工人 任务 评分 矩阵 MP 的 误差 最 小 。 


目标 函数 如 式 (2) 所 示 。 


1 
argmind (U,V )= 225 £i (mp; -U;T7 y EN 
UV 5» 
A, m Ay n 
LA + 2 Vv, 
2 i 2 ^3 


其 中 ,cij 用 于 指示 工人 wi 对 任务 yj 感 兴趣 的 程度 , cj - 1e amp; , 
a 是 衰减 参数 。| 必 ,表示 Frobenius 范 数 ， 加 和 为 是 正则 化 
项 。 式 (2) 可 通过 梯度 下 降 方法 找到 最 优 解 。 
2.1.3 TimeMF 偏好 评分 生成 

利用 上 一 阶段 最 终 学 习 到 的 工人 潜在 特征 向 量 U 和 任务 
潜在 特征 向 量 VV， 生 成 工人 对 任务 的 偏好 MP 。 偏 好 生成 的 
公式 如 下 : 


(2) 


mpy=UVY (3) 

2.2 融入 空间 因素 的 双向 长 短期 记忆 网 络 
为 了 克服 工人 偏好 随 工人 位 置 动态 改变 的 问题 ， 使 用 双 
向 长 短期 记忆 网 络 (Bidirectional Long Short-Term Memory, 
BiLSTM) 学 习 工 人 偏好 , 模型 主要 包括 三 个 部 分 : a) 轨 迹 数 据 
处 理 。 即 对 轨迹 序列 中 的 缺失 值 填充 ; b)BiLSTM 预测 。 通过 
工人 的 GPS 轨迹 序列 预测 工人 下 一 时 刻 可 能 会 到 达 的 位 置 ; 
c)BiLSTM 偏好 评分 生成 。 基 于 上 一 阶段 学 习 到 的 工人 下 一 


时 刻 可 能 到 达 的 位 置 和 平台 内 任务 的 距离 生成 工人 任务 偏好 。 


2.2.1 轨迹 数据 处 理 

对 于 工人 轨迹 数据 中 的 缺失 值 ， 首 先 依据 工人 自身 轨迹 
的 时 空 相关 性 进行 填充 ， 例如， 工人 wi 在 时刻 的 轨迹 信息 
缺失 ， 则 依次 检索 该 时 刻 的 前 5 个 时 刻 和 后 5 个 时 刻 的 轨迹 
言 息 ， 若 查找 到 轨迹 信息 值 ， 则 利用 该 值 填充 工人 wi 在 时 
刻 的 轨迹 信息 Lo 

然后 , 对 于 工人 ui 的 GPS 轨迹 序列 仍然 存在 缺失 值 的 每 个 
时 刻 ， 比 较 工 人 wi 与 其 他 工人 之 间 的 轨迹 相似 性 ， 根 据 其 相似 
工人 在 该 时 刻 的 轨迹 信息 来 填充 轨迹 ， 需 要 注意 的 是 ， 如 果 只 
有 一 名 相似 工人 在 该 时 刻 有 轨迹 信息 ， 则 直接 使 用 该 相似 工人 
的 轨迹 信息 填充 ， 如 果 有 多 名 工人 在 该 时 刻 都 有 轨迹 信息 ， 则 
选择 相似 性 最 大 的 工人 所 在 的 轨迹 信息 填充 该 时 刻 。 

工人 wi 和 工人 ww 的 轨迹 相似 性 通过 下 式 计算 : 


LS,. = 2.5. (li,l*) (4) 


其 中 ， 所 (LWY) 表 未 时 刻 工 人 wi 和 工人 ww 轨迹 位 置 的 相似 
性 ， 由 下 式 得 到 : 


1 , d(lily)&e 
gamh Er (5) 
d(li 17) 表示 大 时 刻 工人 wi; 和 工人 uw 的 距离 ， 若 两 个 工 
人 之 间 的 位 置 距离 小 于 等 于 = ， 认 为 这 两 个 位 置 相 似 ， 记 
&()-1, fW, &(57)-0, 。2 的 值 由 平台 设 定 。 
2.2.2 BiLSTM 预测 
由 于 BiLSTM 模型 中 输入 序列 长 度 必须 相同 ， 因 此 在 
BiLSTM 模型 中 引入 了 滑动 窗口 方法 ， 时 间 窗 口 的 大 小 通过 实 
验 指定 。 工 人 的 轨迹 序列 首先 被 转换 成 固定 长 度 的 输入 和 输出 
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样本 集 ， 然 后 用 这 些 固定 长 度 的 样本 集 来 训练 BiLSTM 模型 。 

BiLSTM 模型 总 共 5 层 : a) 输 入 层 ; DON JZ ; c)BILSTM 
Ei; d)Dropout 层 ; eM E. 

a) 输入 层 : 工人 任务 轨迹 序列 Lu - iG) ih) lth) o 

b) KAJ: 通过 Word Embedding 的 思想 对 工人 的 GPS 
序列 信息 进行 嵌入 ， 得 到 序列 伦 入 同 量 xip。 

c) BiLSTM 层 : 包含 前 向 LSTM 和 后 向 LSTM 两 个 隐 
层 。 将 峙 入 向 量 zp 分 别 输入 到 两 个 隐 层 , 838 [o] Eth — OR , 
其 中 ， 太 为 前 同 LSTM 的 输出 ， 尼 为 后 向 LSTM 的 输出 。 

d) Dropout 层 : 以 预先 设 定 的 概率 停止 神经 元 的 输出 ， 
防止 模型 出 现 过 拟 合 的 问题 。 

e) 输出 层 : 输出 工人 下 一 时 刻 可 能 到 达 的 位 置 exto 
2.2.3 BiLSTM 偏好 评分 生成 

接 下 来 , 建立 工人 对 平台 内 所 有 任务 的 偏好 秆 阵 LP, LP 
中 的 每 一 个 子 元 素 py 使 用 欧 氏 距离 得 到 。 

Ip; = - Ls ll (6) 

其 中 ，4 表示 任务 vi 要 求 的 感知 位 置 ，per 是 工人 下 一 时 刻 
可 能 到 达 的 位 置 。 如 果 工 人 下 一 时 刻 可 能 到 达 的 位 置 Ie 与 
任务 六 距离 很 近 ， 则 工人 很 有 可 能 执行 该 任务 。 
2.9 ”偏好 融合 

将 前 两 个 部 分 的 得 到 的 偏好 评分 MP 和 LP 使 用 逻辑 回 
归 方 法 融合 ， 得 到 工人 最 终 的 偏好 评分 P. P 中 的 每 一 个 子 
JUR py 通过 下 式 得 到 : 


i 1 
P Teexp(- (mp, +1p;)) (7) 


3 ”任务 流行 度 惩罚 因子 设计 

以 往 计算 任务 流行 度 2H 通 过 下 式 计算 : 

pop, == (8) 

E, 是 MCS 平台 内 执行 任务 vj 的 工人 集合 ，m 为 MCS 平台 
总 的 工人 数量 。popj 是 任务 vj 的 流行 度 值 。 

然而 ， 这 种 方法 视 不 同 工 人 对 任务 流行 度 的 影响 是 同 质 
的 ， 其 结果 存在 误差 。 在 移动 群 智 感知 平台 中 ， 任 务 的 流行 
度 与 工人 声誉 有 很 大 关系 。 一 方面 ， MCS 平台 中 的 工人 具有 
从 众 心 理 ， 工 人 执行 任务 的 意愿 容易 收 到 其 他 工人 的 影响 ， 
并 且 ， 声 誉 较 高 的 工人 在 某 一 时 刻 执行 某 个 任务 的 话 ， 则 下 
一 时 刻 容易 吸引 更 多 的 工人 去 执行 该 任务 ， 导 致 该 任务 下 一 
时 刻 的 流行 度 激 增 。 显 然 ， 按 照 以 往 的 做 法 ， 即 出 于 履 盖 率 
保证 的 角度 考虑 , 根据 时 刻 1 的 流行 度 情况 , 在 t+7 时 刻 提升 
任务 的 评分 , 是 不 合理 的 。 因此 , 本 文 引入 工人 声誉 的 计算 ， 
帮助 更 好 地 衡量 下 一 时 刻 的 任务 流行 情况 。 

首先 ， 计 算 工 人 之 间 的 影响 因子 IN E, AETA 
之 间 相 互 影响 的 难 易 程度 ,以 工人 wu; 和 工人 uw 为 例 , 二 者 之 
间 的 影响 因子 iniw: 


in = HL, ^H, | 


E, OH] (9) 
其 中 ， H.ESP AUS LUN wi 和 工人 ww 执行 过 的 任务 集 
合 ， 若 两 个 工人 所 做 的 共同 任务 数量 越 多 ， 则 表明 两 个 工人 
的 亲密 程度 越 高 ， 两 个 工人 之 间 也 就 更 容易 互相 影响 。 
然后 ， 引 入 社交 网 络 来 计算 工人 在 移动 群 智 感 知 平台 的 
声誉 ， 建 立 工 人 声誉 矩阵 WWP。 工 人 声誉 可 以 通过 其 他 工人 
的 点 赞 数 、 评 论 数 量 以 及 工人 之 间 的 朋友 关系 等 多 种 社会 关 
系 来 度量 。 
工人 ui 的 声誉 对 任务 vj 的 流行 度 影 响 可 以 表示 为 
PC; = wp; * £ iN, (10) 


uw SEU; 


其 中 ， UG; z(u.5,. 4 p ss MS] o 因此 ， 任务 的 流行 度 重 新 定 


录用 定稿 
(11) 


接 下 来 ， 对 候选 任务 集合 中 的 任务 流行 度 进行 归 一 化 ， 
使 pop; 的 取 值 在 0-1 之 间 。 


F, m 25 ui cB, pe; 
pop; = : 


_ pop; — popyi, (12) 
POPwar 一 Popm 
其 中 ，popmax 表示 任务 集合 中 所 有 任务 流行 度 的 最 大 值 ， 
popmin 表示 任务 集合 中 所 有 任务 流行 度 的 最 小 值 。 
接 下 来 ,对 MCS 平 台中 每 个 任务 添加 流行 度 惩罚 因子 ， 
该 流行 度 惩罚 因子 可 以 调节 任务 的 推荐 权重 ， 以 此 保证 任务 
推荐 的 履 盖 率 ， 任 务 六 的 流行 度 惩罚 因子 m 由 下 式 计算 : 


pop; 


m.-— 
J 
1 ， pop; <$and sample; < sasmple; (13) 
l- pop; , pop;>¢and sample, < sasmple; 


其 中 ，sample 为 任务 v; 现在 收集 到 的 任务 样本 数量 ， sample, 为 
任务 vw 总共 所 需 的 样本 数量 ， 由 任务 请 求 方 在 发 布 任务 请 求 时 
HELME. p 的 取 值 为 平台 内 所 有 任务 执行 次 数 的 中 位 数 。 


4 ”任务 推荐 列表 生成 


在 任务 流行 度 惩罚 因子 的 基础 上 ， 进 一 步 改 进 工人 对 任务 
的 预测 评分 ， 生 成 任务 推荐 列表 。 工 人 对 任务 最 终 预测 评分 为 
yj = p,*m; (14) 
为 融合 时 空 信息 计 算出 的 工人 偏好 ,mj 为 任务 六 的 流 
行 度 惩罚 因子 。 当 sample; <sample) 时 ,表明 该 任务 还 没有 被 执行 
成 功 ， 针 对 每 一 个 工人 ， 依 据 预 测 出 来 的 其 对 任务 的 评分 矩 
阵 了 ， 将 任务 按照 降序 排列 ， 从 中 选择 前 NN 个 任务 组 成 任务 
列表 推荐 给 工人 ， N 的 个 数 由 平台 自 定 义 设 定 。 和 若 
sample, >saple ， 表 示 该 任务 需要 的 样本 数量 已 经 收集 完成 ， 则 
不 再 向 工人 推荐 该 任务 ,并 将 该 任务 从 候选 任务 集合 中 删除 。 
基于 时 空 信 息 和 流行 度 分 析 的 移动 群 智 感知 任务 推荐 方 
法 的 具体 实现 步骤 如 下 : 
算法 1 TimeMF-BiLSTM 
输入 : 工人 集合 UU， 任务 集合 V， 每 个 工人 的 执行 记录 班 、 任 务 的 执行 
记录 下 、 每 个 工人 的 轨迹 记录 IL、 任 务 所 需 样 本 数量 sample; o 
输出 : 工人 的 任务 推荐 列表 。 
a) 工人 潜在 特征 向 量 U 和 任务 潜在 特征 向 量 V 随机 初始 化 。 
b) 依据 式 (1) 构 建 原始 工人 评分 矩阵 MP。 
c) 构建 式 (2) 的 损失 函数 ， 通 过 梯度 下 降 训练 TimeMF 模型 ， 如 果 损 
失 函 数 小 于 阔 值 ， 则 完成 训练 ， 跳 到 步 又 d); 否则 跳 到 步 又 c)。 
d) 依据 式 (3) 构 建 工 人 的 TimeMF 偏好 评分 矩阵 MP MP 中 的 每 一 
个 子 元 素 mp, 表示 工人 ui 对 任务 vj 的 TimeMF 偏好 。 
e) 依据 式 (5) 计 算 工 人 ui 和 工人 ww 之 间 的 轨迹 相似 性 名 03.0) 。 
f) 遍历 工人 ui 的 轨迹 记录 LL， 如 果 有 =0 ， 使 用 与 工人 ui 轨迹 相似 
性 最 大 的 工人 在 该 时 隙 的 位 置 填充 该 时 际 ; 否则 跳 过 该 时 际 ， 继 续 遍 
历 轨迹 记录 L; 
g) 训练 BiLSTM 模型 ， 输 出 工人 ui 下 一 时 刻 可 能 到 达 的 位 置 Lnext。 
h) 依据 式 (6) 计 算 Lnext 和 任务 vj 的 相似 性 Lpij， 构 建 BiLSTM 偏好 
评分 矩阵 LP, LP 中 的 每 一 个 子 元 素 Lpij 表示 工人 ui 对 任务 vj 的 
BiLSTM 偏好 。 
i) 依据 式 (7) 构 建 工 人 偏好 评分 P. P 中 的 每 一 个 子 元 素 表 示 工 人 ui 
对 任务 vj 的 偏好 评分 。 
j) 依据 式 (13) 构 建 任务 流行 度 惩罚 因子 矩阵 M 的 每 一 个 子 元 素 m; 
表示 任务 vj 的 流行 度 惩罚 因子 。 
k) 计算 工人 最 终 预 测评 分 矩阵 Y, Y 中 的 每 一 个 子 元 素 yij 依据 式 
(14) 计 算 。 
1) 对 于 每 个 工人 w， 将 预测 评分 矩阵 Y 第 宇 行 按照 yi 大 小 降序 提 
列 ， 取 前 N 个 作为 给 工人 ui 的 任务 推荐 列表 和 输出， 如果 任 务 vj 收集 
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到 的 样本 数量 大 于 sampe 则 将 vj; 从 任务 集合 VY 中 剔除 , 转 到 步骤 a). 
为 了 更 直观 地 展示 TimeMF-BiLSTM 的 任务 推荐 过 程 ， 
算法 1 的 流程 图 如 图 2 所 示 。 该 方法 首先 训练 TimeMF 模型 ， 
得 出 工人 TimeMF 偏好 评分 矩阵 MP ; 再 对 工人 轨迹 的 缺失 
值 填 充 ， 输 入 到 BiLSTM 模型 中 ， 预 测 工人 下 一 时 刻 可 能 到 
达 的 位 置 ， 基 于 任务 与 该 位 置 之 间 的 距离 得 到 工人 BiLSTM 
偏好 评分 LP; 然后 ， 将 LP 和 MP 的 对 应 元 素 使 用 逻辑 回归 
方法 融合 到 一 起 ， 综 合 得 到 工人 的 偏好 评分 P: 接 下 来 ， 构 
造 与 任务 流行 度 惩罚 因子 矩阵 M, 并 将 流行 度 惩罚 因子 M 和 
TAME RE P 相 乘 得 到 工人 对 任务 的 最 终 评分 Y， 最 后 ， 
对 应 系统 中 的 每 个 工人 wu， 降 序 排列 工人 评分 矩 阵 Y 的 第 i 
行 ， 取 评分 最 大 的 前 N 个 任务 作为 工人 ui 的 任务 推荐 列表 输 
出 ; 当 任 务 vj 收集 到 的 样本 数量 sample; 所 需 的 样本 满足 要 求 
之 后 , 将 该 任务 从 任务 集合 V 中 移 除 , 并 重新 开始 模型 的 训练 。 


开始 


Y 
T NU, V, H, F, I, sample, 工人 社交 网 络 


y 
工人 潜在 特征 向 最 7 和 任务 潜在 特征 向 量 Y 随 机 初始 化 


PLANT BU 


T 


m 


n 


是 更 新 工人 潜在 特征 向 量 U 和 任务 潜在 特征 向 量 V 


一 一 一 一 构建 TimeMEF 偏 好 评分 矩阵 MP 


对 于 每 一 个 工人 下 EU, IETA” RURE T. Aus BS TL 
迹 相似 性 (r.c) 


跳 过 该 
ETER 


使 用 与 4 相似 性 最 高 的 工人 羽 在 该 时 隙 的 位 置 填充 | 


y 
训练 BiLSTM 模 型 ， 输 出 wu 下 一 时 刻 可 能 到 达 的 位 置 / 


Y 
计算 1 与 v 的 相似 性 ,构建 BiLSTM 偏 好 评分 矩阵 LP 


构建 工人 偏好 评分 P i 
v 
计算 工人 任务 最 终 
sample, > sample 预测 评分 矩阵 了 
不 
是 H 
Y — v 
对 于 工人 ,<。 0， 降序 排 
从 任务 集合 V 中 列 评分 矩阵 了 第 ; 47, Hx 
移 除 任务 v; 其 前 N 个 输出 


图 2 算法 流程 
Fig.2 Algorithm flow chart 


5 ”实验 分 析 


5.1 数据 集 

在 两 个 真实 数据 集 Gowalla23] 和 Foursquare24 上 验证 所 
提 方 法 的 有 效 性 。 所 使 用 数据 集 的 详细 信息 如 下 : 

a) Gowalla 数据 集 : 该 数据 集 包 含 了 196591 个 用 户 从 
2009 年 8 月 至 2010 年 9 月 的 签到 记录 。 通 过 处 理 ， 比 如 删 
除 签到 记录 低 于 20 次 的 工人 以 及 任务 地 点 等 ， 最 终 提 取 了 
216245 条 数据 ， 包 括 78 个 工人 、117 个 任务 和 371 个 位 置 。 

b) Foursquare 数据 集 : 该 数据 集 包 含 2153471 个 用 户 ， 
1143092 个 场所 ，1021970 个 签到 ，27098490 个 社交 关系 以 
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及 用 户 分 配给 场所 的 2809581 评分 所 有 这 些 都 是 通过 公共 
API 从 Foursquare 应 用 程序 中 提取 的 。 在 这 个 数据 集中 ， 首 
先 对 数据 集 做 预 处 理 操作 ， 比 如 删除 签到 记录 低 于 20 次 的 
工人 以 及 任务 地 点 等 。 最 终 剩余 622841 条 数据 , 包括 285 名 
工人 、105 个 任务 和 168 个 地 点 。 
52 参数 设置 

实验 运行 在 一 台 拥 有 Intel Corei5-10210U 处 理 器 ，8GB 
RAM 的 戴尔 笔记 本 电脑 上 。 操 作 系 统 是 windows 10， 编 程 
语言 是 Python3.6。 所 使 用 的 主要 参数 通过 表 1 给 出 。 

表 1 参数 设置 


Tab.1 Parameter settings 
参数 取 值 范围 参数 取 值 范围 
时 段 了 划分 30min 学 习 率 a [0.001,0.05] 
任务 数 n [20,100] 正则 化 参数 8。 [0.01,0.9] 
工人 数 m 15 时 间 窗 口 f 20 
潜在 特征 维度 [10,25] dropout 0.2 
5.8 评价 准则 
a) 准确 度 (Precision) 
hitcount; 
! total recommedation number, (15) 


Precision — 


其 中 ，hitcounti 是 工人 从 任务 推荐 列表 中 执行 的 任务 数量 ， 
total recommendation numberi 代表 推荐 给 工人 ui 的 任务 数量 。 
b) 归 一 化 折 损 累计 增益 (NDCG) 


D 
n (16) 

IDCG 是 理想 条 件 下 的 最 大 DCG fü. NDCG 的 值 介 于 
(0,1) 之 间 ， 用 来 衡量 任务 推荐 列表 中 的 任务 顺序 是 否 与 工人 
偏好 一 致 。 在 MCS 平台 中 , 工人 最 终 选择 的 任务 在 任务 推荐 
列表 中 的 位 置 越 高 ， 该 任务 对 折 损 增益 的 贡献 越 大 ，NDCG 
的 值 越 大 ， 排 名 结果 越 好 。 


NDCG = 


DCG 是 折 损 累计 增益 ， 由 下 式 得 到 : 
b 2rei 一 1 
— log; 41 (17) 


其 中 , b 是 任务 推荐 列表 中 的 任务 数量 。reli; 代 表 该 列表 中 第 i 项 的 
相关 度 ， 如 果 工 人 执行 该 项 任务 ， 则 设置 为 1， 否 则 设置 为 0。 
c) 4 s XE (Coverage) 


Coverage = LV (2c -n-1) pop(v,) (18) 
Hs 


履 盖 率 用 来 描述 能 够 推荐 出 来 得 任务 占 总 任务 的 比例 。 
pop(v.) 是 按照 任务 流行 度 pop 从 大 到 小 排序 的 任务 集合 中 的 
第 c 个 任务 。 

5.4 对 比方 法 

为 了 验证 TimeMF-BiLSTM 方法 的 有 效 性 ， 本 文 将 其 与 
6 个 基线 方法 进行 比较 ， 用 以 证 明 所 提出 的 模型 优 于 其 他 方 
法 。 有 具体 如 下 所 示 。 

TR-UMCR[8]: 该 方法 使 用 基于 混合 用 户 模型 与 列表 级 
排序 学 习 算 法 相 结合 的 协同 排序 任务 推荐 方法 。 

FLTE[1]: 该 方法 利用 逻辑 回归 算法 进行 任务 推荐 。 

RTRA[14]: 该 方法 仅 利 用 矩阵 分 解 模 型 学 习 工 人 和 任务 
的 隐 含 关系 。 

PRTR[18] : 该 方法 将 工人 位 置信 息 和 工人 偏好 结合 起 来 ， 
利用 张 量 分 解 模型 学 习 工 人 和 任务 的 关系 ， 忽 略 工 人 偏好 随 
时 间 动 态 变化 的 影响 。 

TCTR[22]: 该 方法 仅 融 入 时 间 因 素 考 虑 工人 人 和 偏好， 忽略 
工人 偏好 随 位 置 动态 变化 的 影响 。 

RLIN: 与 本 文 所 提出 方法 TimeMF-BiLSTM 不 同 之 处 是 ， 将 
两 种 模型 得 到 的 评分 以 线性 加 权 的 形式 融合 , 比较 线性 加 权 
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和 逻辑 回归 偏好 融合 的 不 同 。 
5.5 性 能 评价 

这 一 节 ， 本 文 展 示 与 其 他 基线 方法 在 评估 指标 上 的 结果 
对 比 。 

表 2 和 表 3 分 别 给 出 了 TimeMF-BiLSTM 任务 推荐 方法 
在 两 个 数据 集 上 的 精确 度 效 果 。 从 表 中 可 以 看 出 ，TimeMF- 
BiLSTM 的 精确 度 远 远 高 于 FLTE, 这 是 由 于 FLTE 不 考虑 工 
人 和 任务 的 隐 含 关系 , 导致 学 习 到 的 工人 偏好 的 准确 性 很 差 ， 
说 明 本 文 模型 更 符合 MCS 任务 推荐 的 实际 应 用 。 当 推荐 列 
表 长 度 N 大 于 15 时 ， 能 够 看 到 TimeMF-BiLSTM 的 精度 大 
于 TR-UMCR .PRTR 以 及 TCTR 算法 ,说 明 TimeMF-BiLSTM 
融合 时 空 因 素 进行 偏好 融合 ， 可 以 更 加 准确 地 捕捉 工人 的 偏 
lf. 可 以 发 现 ，TR-UMCR 和 PRTR 算法 的 效果 大 致 相同 , 这 
是 由 于 这 两 个 算法 均 是 采用 基本 的 矩阵 分 解 模型 ， 并 且 均 融 
入 了 工人 的 位 置信 息 来 提高 推荐 效果 ， 这 个 现象 也 从 侧面 反 
映 出 , 在 MCS 领域 , 工人 执行 任务 的 意愿 与 工人 位 置 有 很 大 
关系 ,此 外 ,与 RLIN 相 比 ,TimeMF-BiLSTM 的 精确 度 略 高 ， 
这 是 由 于 本 文 使 用 工人 的 历史 执行 情况 作为 工人 对 任务 的 评 
分 ， 即 评分 数据 都 是 整数 ， 线 性 回归 方法 预测 出 来 的 分 值 必 
须要 通过 取 整 操作 ， 这 会 造成 部 分 误差 。 随 着 推荐 列表 长 度 
N 的 上 升 ，TimeMF-BiLSTM 的 精确 度 不 断 上 升 ， 在 Gowalla 
数据 集 上 ， 当 推荐 列表 长 度 工 为 20 时 ，TimeMF-BiLSTM 方 
法 的 精确 度 最 终 收敛 到 94.3% 左 右 。 综 上 所 述 , 依据 TimeMF- 
BiLSTM 方法 向 工人 推荐 任务 在 精确 度 方面 更 具有 优势 。 
表 2 不 同 推荐 长 度 N 在 Gowalla 数据 集 的 推荐 精确 度 


Tab.2 Accuracy of different recommended length N on 


—— 


Gowalla dataset 


方法 5 10 15 20 
TimeMF-BiILSTM 32.2% 59.6% 88.4% 94.3% 
TR-UMCR 36.8% 58.4% 82.9% 90.2% 
FLTE 21.9% 30.7% 64.1% 70.5% 
RTRA 25.2% 38.1% 73.8% 82.4% 
TCTR 39.6% 59.9% 78.3% 88.9% 
PRTR 37.7% 60.3% 80.8% 87.6% 
RLIN 30.2% 58.5% 82.1% 91.6% 


43 不 同 推荐 长 度 N E Foursquare 数据 集 上 的 推荐 精确 度 指标 


Tab.3 Accuracy of different recommended length N on 


Foursquare dataset 


方法 5 10 15 20 
TimeMF-BiLSTM 33.9% 57.5% 78.9% 92.1% 
TR-UMCR 27.71% 57.1% 77.5% 89.2% 
FLTE 21.0% 25.1% 57.1% 63.3% 
RTRA 25.2% 33.9% 70.1% 78.5% 
TCTR 20.7% 43.5% 77.4% 89.2% 
PRTR 37.7% 60.3% 84.8% 85.1% 
RLIN 31.6% 53.4% 81.8% 89.5% 


另外 ， 从 表 2 和 表 3 可 以 发 现 ， 当 推荐 列表 长 度 低 于 10 
时 ，TimeMF-BiLSTM 的 精度 略 小 于 PRTR, 这 是 因为 本 文 的 
算法 考虑 了 任务 的 流行 度 惩 罚 ， 导 致 推荐 的 精度 稍 有 降低 。 
为 进一步 验证 该 现象 ， 本 文 从 Foursquare 数据 集 随机 抽取 特 
定 用 户 以 及 其 历史 执行 任务 的 记录 等 相关 信息 作为 测试 样本 。 
具体 来 说 ， 本 文选 择 的 工人 ID 号 为 9 号 ， 取 任务 集合 中 ID 
从 1 至 20 号 任务 作为 训练 集 ， 工 人 9 对 这 20 个 任务 的 真实 
偏好 评分 值 以 及 依据 本 文 所 提 方 法 对 这 些 任 务 的 预测 评分 情 
况 如 表 4 所 示 。 从 表 4 可 以 看 出 ， 理 论 上 来 讲 ， 依 据 工 人 对 
不 同 任务 的 评分 高 低 来 生成 任务 列表 ， 工 人 9 真实 最 优 的 任 
务 ID 列表 应 该 为 [3,4,8,2,6,7,1,5,9,10]。 

然后 ， 依 据 本 文 所 提 方 法 预测 工人 9 对 这 10 项 任务 的 
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评分 ， 结 果 显 示 ， 所 提 方 法 对 工人 9 的 预测 偏好 评分 P 结果 
在 表 4 展示 ， 可 以 发 现 预测 偏好 评分 P 与 工人 9 的 真实 评分 
的 均 方 误差 为 0.414152， 与 工人 9 的 真实 偏好 非常 接近 ， 证 
明 本 文 所 提 方 法 在 预测 工人 偏好 方面 的 准确 性 。 但 是 ， 如 果 
仅 以 此 作为 推荐 结果 的 话 , 任务 2、3、4、8 由 于 较 高 的 评分 ， 
工人 9 下 一 次 的 推荐 列表 前 $ 个 位 置 将 全 是 任务 区 域 Cs 和 
C4 的 任务 ， 这 会 导致 工人 9 越 来 越 偏 爱 于 任务 区 域 C3 和 C4 
的 任务 , 那么 任务 区 域 C3 和 Csy 的 任务 流行 度 就 会 越 来 越 高 ， 
而 工人 9 执行 任务 的 总 次 数 是 一 定 的 ， 那 么 相应 地 ， 任 务 区 
域 Cl/ 和 C2 则 会 由 于 缺乏 足够 的 推荐 而 收集 不 到 充分 的 样本 。 
因此 ， 本 文 使 用 流行 度 惩罚 因子 ， 调 整流 行 度 过 高 的 任务 权 
E, 得 到 最 终 的 工人 任务 预测 评分 矩阵 了, 结果 在 表 4 展示 ， 
可 以 发 现 调整 之 后 工人 9 的 最 终 预测 评分 了 与 工人 9 的 真实 
评分 的 均 方 误差 稍 有 提升 ， 但 是 任务 2、3、4、8 的 推荐 权重 
明显 降低 ， 任 务 区 域 Ci 和 Co 区 域 处 于 工人 下 一 时 刻 的 任务 
列表 中 靠 前 位 置 ， 这 对 于 提升 任务 推荐 的 履 盖 率 是 非常 有 帮 
助 的 ， 这 一 现象 与 本 文 的 初衷 ， 也 就 是 适当 降低 推荐 精度 ， 
促进 推荐 效果 覆盖 率 ， 是 非常 一 致 的 。 而 随 着 推荐 列表 长 度 
不 断 增加 ,也 就 是 说 一 次 性 推荐 给 工人 的 任务 数量 不 断 增加 ， 
那么 每 一 次 推荐 的 任务 列表 所 能 覆盖 的 范围 就 会 越 来 越 来 ， 
即 推荐 效果 的 覆盖 率 越 来 越 大 ， 此 时 ， 为 满足 履 盖 率 要 求 而 
设置 的 流行 任务 的 惩罚 因子 就 会 越 来 越 小 ， 那 么 推荐 效果 的 
精确 度 也 就 会 逐渐 增加 了 。 
表 4 样本 实例 


Tab.4 Sample instance 
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较 于 其 他 基线 方法 ,本 文 算法 具有 更 高 的 覆盖 率 。 其 原因 是 ， 
以 往 的 算法 没有 考虑 任务 的 流行 度 偏 差 ， 造 成 过 度 推荐 流行 
性 任务 。 本 文 利 用 任务 流行 度 设立 惩罚 因子 ， 进 而 降低 流行 
性 过 高 的 任务 权重 ， 提 高 冷门 任务 选择 的 概率 ， 因 此 当 任务 
数量 不 断 增 加 时 ，TimeMF-BiLSTM 任务 推荐 方法 也 能 保证 
工人 有 更 多 的 机 会 选择 其 他 任务 。 


—3— TimeMF-BiLSTM 


0.3 —6— TR 
一 一 FLTE 

02- —A— RTRA 
—— TCTR 

0.1 上 —H— PRTR 
—N— RLIN 

0 1 1 
5 10 15 20 
推荐 列表 长 度 N 


图 4 覆盖 率 性 能 对 比 (Gowalla 数据 集 ) 


Fig.4 Comparison of coverage (Gowalla dataset) 


5 10 15 20 


任务 ID 真实 评分 任务 所 属 区 域 ”预测 偏好 评分 P 最 终 预 测评 分 了 推荐 列表 长 度 N 

1 2 C; 2.78933511 2.78933511 图 5 覆盖 率 性 能 对 比 (Foursquare 数据 集 ) 

2 3 C; 3.56075737 1.61037869 Fig. 5 Comparison of coverage (Foursquare dataset) 

3 6 C; 5.54626787 0.00000000 最 后 ， 在 两 个 数据 集 上 进行 实验 ， 以 验证 工人 声誉 关系 

4 5 C, 4.39667412 0.92437798 对 任务 覆盖 率 的 影响 ， 如 图 6 和 图 7 所 示 。 推 荐 列表 长 度 为 

5 2 C; 3.09950478 3.09950478 20, Ed 5 中 的 不 同 线条 表明 本 文 计算 工人 声誉 时 引入 的 社交 

6 3 Cy 3.09983137 3.09983137 网 络 信 息 条 数 ， 横 坐标 表示 移动 群 智 感知 平台 中 工人 和 任务 

7 3 C2 2.95584221 2.95584221 的 比率 ， 理 论 上 来 说 ， 当 平台 内 工人 和 任务 的 比率 不 断 增加 

8 5 C; 4.54064423 0.75677404 时 ， 推 荐 的 覆盖 率 会 成 比例 下 降 。 从 图 中 可 以 看 出 ， 工 人 声 

9 1 C; 1.60706052 1.60706052 誉 的 引入 ， 可 以 保证 任务 推荐 覆盖 率 的 下 降 速 度 变 缓慢 ， 这 
= 10 0 Ci 0.63975154 1.63975154 是 由 于 工人 声誉 可 以 让 本 文 更 准确 的 分 析 任务 流行 度 ， 对 流 
[az 接 下 来 ， 将 推荐 长 度 N 设置 为 20， 图 3 展示 TimeMF-  ” 行 任务 的 惩罚 也 就 更 加 准确 ， 因 此 当 工 人 和 任务 的 比率 不 断 


BiLSTM 与 其 他 基线 方法 在 NGDD 指标 的 性 能 对 比 。 本 文 将 
计算 折 损 累计 增益 时 的 参数 b 设置 为 n, n 是 MCS 平台 中 的 
任务 数量 ， 由 平台 当前 的 候选 任务 数量 决定 。 可 以 发 现 ， 
TimeMF-BiLSTM 的 NDCG 明显 高 于 其 他 基线 方法 ， 并 且 比 
逻辑 回归 方法 的 NDCG 高 了 将 近 一 倍 左右 , 证 明 本 文 的 模型 
评价 排序 的 准确 性 。 

人 
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图 3 NDCG 的 性 能 对 比 图 

Fig.3 Comparison of NDCG 
图 4 和 图 5 显示 不 同方 法 在 两 个 数据 集 上 的 覆盖 率 指标 
情况 ， 本 文 将 TimeMF-BiLSTM 方法 及 其 他 基线 算法 重复 运 
行 50 次 , 取 其 平均 值 作为 不 同 算法 的 窗 盖 率 值 。 从 图 中 可 以 
看 出 ， 履 盖 率 与 推荐 列表 的 长 度 N 呈现 正 相 关 关 系 ， 并 且 相 


NDCG 
o 


T e 数 据 集 


Tm 


增加 时 ，TimeMF-BiLSTM 方法 也 能 保证 任务 推荐 的 履 盖 率 
下 降 速 度 最 慢 。 从 图 中 可 以 看 出 ， 当 任务 和 工人 的 比率 为 10 
时 ， 平 台 的 覆盖 率 仍 可 以 超过 71%。 并 且 从 图 中 可 以 发 现 ， 
随 着 工人 社会 关系 引入 条 数 的 不 断 增 加 ， 和 覆盖 率 下 降 速 度 越 
来 越 慢 ， 因 此 在 保证 任 推荐 的 覆盖 率 时 有 必要 引入 工人 之 间 
的 社会 关系 。 这 些 实验 结果 表明 ，TimeMF-BiLSTM 在 MCS 
实际 应 用 中 具有 更 全 面 的 性 能 。 


6 ”结束 语 


本 文 针 对 移动 群 智 感知 领域 在 挖掘 工 人 俩 好 时 忽略 时 空 
音 上 县 和 任务 流行 度 影响 ， 导 致 任务 推荐 的 准确 性 和 履 盖 率 低 
的 问题 ， 设 计 了 融合 时 空 信 息 和 任务 流行 度 分 析 的 任务 推荐 
方法 。 融 合 时 空 信息 可 以 准确 地 挖掘 工人 偏好 ， 而 任务 流行 
度 分 析 可 以 有 效 地 缓解 现 有 研究 任务 履 盖 率 低 的 问题 ， 所 提 
方法 将 时 间 因 素 、 空 间 因 素 两 个 方面 对 推荐 的 影响 分 开 计 算 ， 
可 以 有 效 地 缓解 现 有 方法 需要 频繁 更 新 的 缺点 。 本 文 所 提 方 
法 适用 于 所 有 具有 时 空 背景 的 项 目 推荐 问题 ， 同 时 由 于 不 同 
模型 相互 独立 ,未 来 更 多 影响 工人 意愿 的 因素 可 以 轻松 骨 入 ， 
并 且 所 提 方 法 将 推荐 的 精度 和 履 盖 率 两 个 指标 分 开 优 化 求解 ， 
支持 其 他 多 种 优化 目标 组 合 ， 有 具有 良好 的 可 扩展 性 。 在 两 个 
真实 数据 集 上 实验 本 文 方法 的 有 效 性 ， 实 验 结果 表明 ， 与 现 


录用 定稿 


有 的 基线 方法 相 比 ， 本 文 所 提 方 法 在 准确 率 和 和 者 盖 率 具 有 展 
好 的 效果 ， 证 明了 该 方法 在 处 理 移动 群 智 感知 任务 推荐 领域 
实际 应 用 方面 具有 出 色 的 性 能 。 在 今后 的 工作 中 ， 本 文 将 考 
虑 更 多 可 能 影响 MCS 平台 任务 推荐 效果 的 因素 ， 并 进一步 
研究 如 何 用 更 短 的 训练 时 长 来 及 时 捕捉 工人 偏好 ， 为 工人 提 
供 更 好 的 服务 体验 。 
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图 6 工人 声誉 对 两 个 数据 集 履 盖 率 的 影响 (Gowalla 数据 集 ) 


Fig.6 Influence of worker reputation on accuracy (Gowalla dataset) 
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图 7 TAE ŽI WA A SET as ERO REUS] (Foursquare 数据 集 ) 


Fig.7 Influence of worker reputation on accuracy (Foursquare dataset) 


参考 文献 : 


[1] Ganti R K, Ye F, Lei H. Mobile crowdsensing: current state and future 
challenges [J]. IEEE Communication Magazine, 2011, 49 (11): 32-39. 


[2] Montori F, Bedogni L, Bononi L. A collaborative internet of things 
architecture for smart cities and environmental monitoring [J]. IEEE 
Internet of Things Journal, 2018, 5 (2): 592-605. 

[3] Jovanović S, Jovanović M, Škorić T, et al. A mobile crowd sensing 
application for hypertensive patients [J]. Sensors. 2019, 19 (2): 400-416. 

[4] Huang Jungin, Kong Linghe, Dai Hongning, et al. Blockchain based 
mobile crowd sensing in industrial systems [J]. IEEE Trans on Industrial 
Informatics, 2019, 16 (10): 6553-6563. 

[5] Kim K, Zabihi H, Kim H, et al. TrailSense: a crowdsensing system for 
detecting risky mountain trail segments with walking pattern analysis [J]. 
Proceedings of the Acm on Interactive Mobile Wearable & Ubiquitous 
Technologies, 2017, 1 (3): 1-31. 

[6] Wan Jiafu, Liu Jianqi, Shao Zehui, et al. Mobile crowd sensing for traffic 
prediction in internet of vehicles [J]. Sensors, 2016, 16 (1): 88-102. 

[7] Yucel F, Yuksel M, Bulut E. QoS-based budget constrained stable task 
assignment in mobile crowdsensing [J]. IEEE Trans on Mobile 
Computing, 2021, 20 (11): 3194-3210. 

[8] 4k, AEk, RAE, F. 移动 群 智 感知 中 基于 协同 排序 的 任务 推 
荐 方法 [J]. 电子 学 报 , 2021, 49 (10): 2012-2019. (Wang Jian, Liu 
Jiaxin, Zhao Guosheng, et at. Task recommendation method based on 
collaborative ranking in mobile crowd sensing [J]. Acta Electronica 
Sinica, 2021, 49 (10): 2012-2019.) 

[9] Zhao Zhongnan, Wang Yanli, Wang Huiqiang. SDN-based cross-domain 


杨 桂 松 ， 等 : 基于 时 空 信息 和 任务 流行 度 分 析 的 移动 群 智 感知 任务 推荐 


/ O | ZW 


第 39 卷 第 9 期 


cooperative method for trusted nodes recommendation in Mobile crowd 
sensing [J]. Peer-to-Peer Networking and Applications, 2021, 14 (5): 
3793—3805. 

[10] Tang Wenjuan, Zhang Kuan, Ren Ju, et al. Privacy-preserving task 
recommendation with win-win incentives for mobile crowdsourcing [J]. 
Information Sciences, 2020, 527: 477-492. 

[11] Karaliopoulos M, Koutsopoulos I, Titsias M. First learn then earn: 
optimizing mobile crowdsensing campaigns through data-driven user 
profiling [C]// Proc the 17th ACM International Symposium on Mobile 
Ad Hoc Networking and Computing. New York: ACM Press, 2016: 271— 
280. 

[12] Wang Zhibo, Zhao Jing, Hu Jiahui, et al. Towards personalized task- 
oriented worker recruitment in mobile crowdsensing [J]. IEEE Trans on 
Mobile Computing, 2021, 20 (5): 2080-2093. 

[13] Kumar P, Thakur R S. Recommendation system techniques and related 
issues: a survey [J]. International Journal of Information Technology, 
2018, 10 (4): 495—501. 

[14] Yuen M C, King I, Leung K S. Taskrec: a task recommendation 
framework in crowdsourcing systems [J]. Neural Processing Letters, 
2015, 41 (2): 223-238. 

[15] Wang Jian, Liu Jiaxin, Zhao Zhongnan, et al. A task recommendation 
framework for heterogeneous mobile crowdsensing [J]. The Journal of 
Supercomputing, 2021, 2021 (48): 12121-12142. 

[16] Dai Wei, Wang Yufeng, Ma Jianhua, et al. BTR: a feature-based bayesian 
task recommendation scheme for crowdsourcing system [J]. IEEE Trans 
on Computational Social Systems, 2020, 7 (3): 780-789. 

[17] Yang Shuo, Zheng Zhenzhe, Tang Shaojie, et al. Fine-grained user 
profiling for personalized task matching in mobile crowdsensing [J]. 
IEEE Trans on Mobile Computing, 2021, 20 (10): 2961-2976. 

[18] Yang Guisong, Li Yanting, He Xingyu, et al. Profile-free and real-time 
task recommendation in mobile crowdsensing [J]. IEEE Trans on 
Computational Social Systems, 2021, 8 (6): 1311-1322. 

[19] Noulas A, Scellato S, Lathia N, et al. Mining user mobility features for 
next place prediction in location-based services [C]// IEEE International 
Conference on Data Mining. Piscataway, NJ: IEEE Press, 2012: 1038- 
1043. 

[20] Song Shiwei, Liu Zhidan, Li Zhenjiang, et at. Coverage-oriented task 
assignment for mobile crowdsensing [J]. IEEE Internet of Things Journal, 
2020, 7 (8): 7407-7418. 

[21] E T, KR, Zik, F. 推荐 系统 中 考虑 流行 程度 差异 的 评分 预测 算 
法 [J]. 软件 导 刊 , 2021, 20 (11): 18-21. (Wang Ning, Zhang Wei, Su 
Zhan, et at. Rating prediction algorithm considering popularity 
differences in recommender systems [J]. Software Guide, 2021, 20 (11): 
18-21.) 

[22] Mcy A, Ik B, Ksl B. Temporal context-aware task recommendation in 
crowdsourcing systems [J]. Knowledge-Based Systems, 2021, 219 (1): 
106770. 

[23] Scellato S, Noulas A, Lambiotte R, et al. Socio-spatial properties of 
online location-based social networks [C]// Proc of the 5th International 
Conference on Weblogs and Social Media. Barcelona: [s. n. ] , 2011: 329- 
336. 

[24] Vasconcelos M A, Ricci S, Almeida J, et al. Tips, dones and todos: 
uncovering user profiles in foursquare [C]// Proc of the 5th ACM 
International Conference on Web Search and Data Mining. New York: 


ACM Press, 2012: 653-662. 


